草庐IT

Python库提取 \'epub\'信息

全部标签

python - 如何从 XML 文件中获取数据?

我正在尝试从XML文件中获取数据,我尝试了其中的一些代码,但无法获得正确的结果。importxml.etree.ElementTreeasetreeXmlD=etree.parse("MVI_20011.xml")root=XmlD.getroot()forchildinroot:print(child.get("density"),child.get("num"))forchildreninchild:print(children.text)这是我的XML文件的一些行:我想获取第一帧预期的每一帧的数据:(7,1)592.75378.8160.05162.2557.65120.9847

python - 使用 DOM 更改现有 XML 文件中的元素值

我正在尝试查找有关如何更改现有xml文件元素值的示例。使用以下xml示例:MyBookJohnSmith如果我想在使用DOM的Python脚本中将作者元素值“JohnSmith”替换为“JimJohnson”,我该怎么做?我试图寻找这方面的例子,但没有成功。任何帮助将不胜感激。问候,歌词 最佳答案 假设s='''MyBookJohnSmith'''DOM看起来像:fromxml.domimportminidomdom=minidom.parseString(s)#orparse(filename_or_file)forauthori

python - 使用 xml.dom.minidom 更新元素值

我有一个类似于以下内容的XML结构:123456XYZno7890XYZ2yes我愿意仅使用xml.dom.minidom(限制)1)遍历XML文件2)根据其父元素搜索/获取特定元素示例:作者1的结帐元素,作者2的isbn3)更改/设置该元素的值4)将新的XML结构写入文件有人可以帮忙吗?谢谢!更新:这是我到现在所做的importxml.dom.minidomcheckout="yes"defgetLoneChild(node,tagname):assert((nodeisnotNone)and(tagnameisnotNone))elem=node.getElementsByTagN

Python:在保留实体的同时解析 XML 文档

我想问一下已知的现有Python2.x库有哪些用于解析带有内置DTD而不自动扩展实体的XML文档。(好奇的人有问题的文件:JMdict。)lxml似乎有一些不解析实体的选项,但最后我尝试过,实体最终被转换为空白。我只是用谷歌搜索了一下,发现pxdom作为我可以尝试的另一种选择,但由于它是纯Python,所以它似乎比我想要的慢得多。还有其他的吗? 最佳答案 lxml问题中提到了它,据我所知,它可以满足您的要求。测试代码:fromlxmlimportetreeXML="""]>&abc;"""parser=etree.XMLParser

sql - 从 SQL XML 字段中提取值

使用MSSQLServer,我在XML字段(称为XML)中获得了一些数据,其结构如下:InsertLG40016181我正在尝试创建一个SQL查询来获取另一个名为SubmittedDate的列,以及来自该XML字段的PO_NBR。作为XPath的新手,我阅读了许多示例并尝试了query和value,但我还没有成功。例如:SELECTSubmittedDate,XML.query('data(/POHeader/PO_NBR)')asPO_NBRFROMSubmitXML这只会给我一个空列。从Quassnoi获得工作测试后,我从他的XML工作到我的,发现问题是根节点中的xmlns和xml

Python 迷你王国 : Change Value of Node

我正在使用Python的minidom库来尝试操作一些XML文件。这是一个示例文件:http://www.this-is-a-url.com/Thisissomeinformation!http://www.this-is-a-url.com/Thisissomeinformation!http://www.this-is-a-url.com/Thisissomeinformation!我需要做的是获取“描述”中的值并将其放入“链接”中,这样​​两者都会说“这是一些信息!”。我试过这样做:#!/usr/bin/pythonfromxml.dom.minidomimportparsexm

python - 防止 xml.etree.ElementTree.xml( ) 在元素标签中包含网站名称

我正在使用python并尝试获取一些XML并将其转换为字典。代码工作正常,除了一些奇怪的文本被添加到元素标签,然后被添加到dict属性名称。此文本似乎是“WebServiceGeocodeQueryResult”属性的值:“xmlns”。我的代码看起来像这样:importxml.etree.ElementTreeasETimportxml_to_dictionary#ThisissomecodeIfound,itseemstoworkfine:#http://code.activestate.com/recipes/410469-xml-as-dictionary/defdoSomeS

python - 通过 Python 注释和取消注释 XML

我想知道一种使用Python对XML中的元素进行注释和取消注释的方法。如何让它看起来像这样:-->然后根据需要再次删除评论...或我正在使用xml.dom中的minidom。我需要使用不同的XML解析器吗?宁愿避免使用正则表达式...那将是一场噩梦。 最佳答案 下面的脚本使用xml.dom.minidom并包含用于注释和取消注释节点的函数:fromxml.domimportminidomxml="""\"""defcomment_node(node):comment=node.ownerDocument.createComment(

sql - 使用 SSIS 将表数据的 XML 表示形式提取到文件中

我正在尝试使用SSIS将查询结果集的XML表示形式提取到文本文件中。当我在SSMS中运行查询时,我的查询当前成功地提取了我需要的确切XML输出。我已经尝试了所有我能找到的技巧来使用SSIS包中的这个结果集来创建文件。使用数据流将OLE源移植到平面文件不起作用,因为XML查询的输出被视为TEXT,而SSIS无法将TEXT、NTEXT或IMAGE推送到文件目标。然后我尝试执行SQL任务来填充用户变量,然后使用脚本任务(使用C#编写)将该用户变量的内容写入文件输出,但用户变量始终为空。我不知道,但我再次怀疑这是因为XML被视为TEXT或IMAGE,而用户变量不处理此问题。查询是这样的形式:选

python - 如何使用 Python 库验证 XML 文件时出现多个错误?

我有一些要验证的XML文件,我必须使用Python来验证。我尝试使用带有lxml的XSD对其进行验证。但是我只得到一个首先发生的错误,但我需要XML文件中的所有错误和不匹配项。有什么方法可以让我设法获取lxml的所有错误列表?或者还有其他Python解决方案吗? 最佳答案 解决这个问题的方法是:try:xmlschema.assertValid(xml_to_validate)exceptetree.DocumentInvalid,xml_errors:passprint"Listoferrors:\r\n",xml_errors.